К статье
МАТЕМАТИЧЕСКИЙ АНАЛИЗ
Площади. При изучении площадей криволинейных плоских фигур открываются новые аспекты математического анализа. Такого рода задачи пытались решать еще древние греки, для которых определение, например, площади круга было одной из труднейших задач. Больших успехов в решении этой проблемы добился Архимед, которому также удалось найти площадь параболического сегмента (рис. 12). С помощью весьма сложных рассуждений Архимед доказал, что площадь параболического сегмента составляет 2/3 от площади описанного прямоугольника и, следовательно, в данном случае равна (2/3)(16) = 32/3. Как мы увидим в дальнейшем, этот результат можно легко получить методами математического анализа.
Предшественники Ньютона и Лейбница, главным образом Кеплер и Кавальери, решали задачи о вычислении площадей криволинейных фигур с помощью метода, который трудно назвать логически обоснованным, но который оказался чрезвычайно плодотворным. Когда же Валлис в 1655 соединил методы Кеплера и Кавальери с методами Декарта (аналитической геометрией) и воспользовался только что зародившейся алгеброй, сцена для появления Ньютона была полностью подготовлена.
Валлис разбивал фигуру, площадь которой требовалось вычислить, на очень узкие полоски, каждую из которых приближенно считал прямоугольником. Затем он складывал площади аппроксимирующих прямоугольников и в простейших случаях получал величину, к которой стремилась сумма площадей прямоугольников, когда число полосок стремилось к бесконечности. На рис. 13 показаны прямоугольники, соответствующие некоторому разбиению на полоски площади под кривой y = x2.
Основная теорема. Великое открытие Ньютона и Лейбница позволило исключить трудоемкий процесс перехода к пределу суммы площадей. Это было сделано благодаря новому взгляду на понятие площади. Суть в том, что мы должны представить площадь под кривой как порожденную ординатой, движущейся слева направо и спросить, с какой скоростью изменяется заметаемая ординатами площадь. Ключ к ответу на этот вопрос мы получим, если рассмотрим два частных случая, в которых площадь заранее известна.
Начнем с площади под графиком линейной функции y = 1 + x, поскольку в этом случае площадь можно вычислить с помощью элементарной геометрии.
Пусть A(x) - часть плоскости, заключенная между прямой y = 1 + x и отрезком OQ (рис. 14). При движении QP вправо площадь A(x) возрастает. С какой скоростью. Ответить на этот вопрос нетрудно, так как мы знаем, что площадь трапеции равна произведению ее высоты на полусумму оснований. Следовательно,
Скорость изменения площади A(x) определяется ее производной
Мы видим, что A?(x) совпадает с ординатой у точки Р. Случайно ли это. Попробуем проверить на параболе, изображенной на рис. 15. Площадь A (x) под параболой у = х2 в интервале от 0 до х равна A(x) = (1/3)(x)(x2) = x3/3. Скорость изменения этой площади определяется выражением
которое в точности совпадает с ординатой у движущейся точки Р.
Если предположить, что это правило выполняется в общем случае так, что
есть скорость изменения площади под графиком функции y = f(x), то этим можно воспользоваться для вычислений и других площадей. На самом деле, соотношение A?(x) = f(x) выражает фундаментальную теорему, которую можно было бы сформулировать следующим образом: производная, или скорость изменения площади как функции от х, равна значению функции f (x) в точке х.
Например, чтобы найти площадь под графиком функции y = x3 от 0 до х (рис. 16), положим
Возможный ответ гласит:
так как производная от х4/4 действительно равна х3. Кроме того, A(x) равна нулю при х = 0, как и должно быть, если A(x) действительно является площадью.
В математическом анализе доказывается, что другого ответа, кроме приведенного выше выражения для A(x), не существует. Покажем, что это утверждение правдоподобно с помощью следующего эвристического (нестрогого) рассуждения. Предположим, что существует какое-либо второе решение В(x). Если A(x) и В(x) "стартуют" одновременно с нулевого значения при х = 0 и все время изменяются с одинаковой скоростью, то их значения ни при каком х не могут стать различными. Они должны всюду совпадать; следовательно, существует единственное решение.
Как можно обосновать соотношение A?(x) = f(x) в общем случае. На этот вопрос можно ответить, лишь изучая скорость изменения площади как функции от х в общем случае. Пусть m - наименьшее значение функции f (x) в интервале от х до (x + h), а M - наибольшее значение этой функции в том же интервале. Тогда приращение площади при переходе от х к (x + h) должно быть заключено между площадями двух прямоугольников (рис. 17). Основания обоих прямоугольников равны h. Меньший прямоугольник имеет высоту m и площадь mh, больший, соответственно, М и Mh. На графике зависимости площади от х (рис. 18) видно, что при изменении абсциссы на h, значение ординаты (т.е. площадь) увеличивается на величину, заключенную между mh и Mh. Угловой коэффициент секущей на этом графике находится между m и M. Что происходит, когда h стремится к нулю. Если график функции y = f(x) непрерывен (т.е. не содержит разрывов), то и М, и m стремятся к f(x). Следовательно, угловой коэффициент A?(x) графика площади как функции от х равен f(x). Именно к такому заключению и требовалось придти.
Лейбниц предложил для площади под кривой y = f(x) от 0 до а обозначение
При строгом подходе этот так называемый определенный интеграл должен быть определен как предел некоторых сумм на манер Валлиса. Учитывая полученный выше результат, ясно, что этот интеграл вычисляется при условии, что мы можем найти такую функцию A(x), которая обращается в нуль при х = 0 и имеет производную A?(x), равную f (x). Нахождение такой функции принято называть интегрированием, хотя уместнее эту операцию было бы называть антидифференцированием, имея в виду, что она является в некотором смысле обратной дифференцированию. В случае многочлена интегрирование выполняется просто. Например, если
то
в чем нетрудно убедиться, продифференцировав A(x).
Чтобы вычислить площадь А1 под кривой y = 1 + x + x2/2, заключенную между ординатами 0 и 1, мы просто записываем
и, подставляя х = 1, получаем A1 = 1 + 1/2 + 1/6 = 5/3. Площадь A(x) от 0 до 2 равна A2 = 2 + 4/2 + 8/6 = 16/3. Как видно из рис. 19, площадь, заключенная между ординатами 1 и 2, равна A2 - A1 = 11/3. Обычно она записывается в виде определенного интеграла
Объемы. Аналогичные рассуждения позволяют удивительно просто вычислять объемы тел вращения. Продемонстрируем это на примере вычисления объема шара, еще одной классической задачи, которую древним грекам, с помощью известных им методов, удалось решить с великим трудом.
Повернем часть плоскости, заключенной внутри четверти круга радиуса r, на угол 360. вокруг оси х. В результате мы получим полушарие (рис. 20), объем которого обозначим V(x). Требуется определить, с какой скоростью возрастает V(x) с увеличением x. Переходя от х к х + h, нетрудно убедиться в том, что приращение объема меньше, чем объем ?(r2 - x2)h кругового цилиндра радиуса и высотой h, и больше, чем объем ?h цилиндра радиуса и высотой h. Следовательно, на графике функции V(x) угловой коэффициент секущей заключен между ?(r2 - x2) и ?. Когда h стремится к нулю, угловой коэффициент стремится к
Следовательно,
При x = r мы получаем
для объема полушария, и, следовательно, 4?r3/3 для объема всего шара.
Аналогичный метод позволяет находить длины кривых и площади искривленных поверхностей. Например, если a(x) - длина дуги PR на рис. 21, то наша задача состоит в вычислении a??x). Воспользуемся на эвристическом уровне приемом, который позволяет не прибегать к обычному предельному переходу, необходимому при строгом доказательстве результата. Предположим, что скорость изменения функции а(x) в точке Р такая же, какой она была бы при замене кривой ее касательной PT в точке P. Но из рис. 21 непосредственно видно, при шаге h вправо или влево от точки х вдоль РТ значение а(x) меняется на
Следовательно, скорость изменения функции a(x) составляет
Чтобы найти саму функцию a(x), необходимо лишь проинтегрировать выражение, стоящее в правой части равенства. Оказывается, что для большинства функций выполнить интегрирование довольно трудно. Поэтому разработка методов интегрального исчисления составляет большую часть математического анализа.
Первообразные. Каждую функцию, производная которой равна данной функции f(x), называют первообразной (или примитивной) для f(x). Например, х3/3 - первообразная для функции х2, так как (x3/3). = x2. Разумеется, х3/3 - не единственная первообразная функции х2, так как x3/3 + C также является производной для х2 при любой константе С. Однако мы в дальнейшем условимся опускать такие аддитивные постоянные. В общем случае
где n - положительное целое число, так как (xn + 1/(n + 1)). = xn. Соотношение (1) выполняется в еще более общем смысле, если n заменить любым рациональным числом k, кроме -1.
Произвольную первообразную функцию для заданной функции f(x) принято называть неопределенным интегралом от f(x) и обозначать его в виде
Например, так как (sin x). = cos x, справедлива формула
Из формулы (1) следует, что для n . -1. Так как (lnx). = x-1, то .
Во многих случаях, когда существует формула для неопределенного интеграла от заданной функции, ее можно найти в многочисленных широко публикуемых таблицах неопределенных интегралов. Табличными являются интегралы от элементарных функций (в их число входят степени, логарифмы, показательная функция, тригонометрические функции, обратные тригонометрические функции, а также их конечные комбинации, получаемые с помощью операций сложения, вычитания, умножения и деления). С помощью табличных интегралов можно вычислить интегралы и от более сложных функций. Существует много способов вычисления неопределенных интегралов; наиболее распространенный из них метод подстановки или замены переменной. Он состоит в том, что если мы хотим в неопределенном интеграле (2) заменить x на некоторую дифференцируемую функцию x = g(u), то, чтобы интеграл не изменился, надо x заменить на g?(u)du. Иначе говоря, справедливо равенство
Пример 1.
(подстановка 2x = u, откуда 2dx = du).
Приведем еще один метод интегрирования - метод интегрирования по частям. Он основан на известной уже формуле
Ее можно записать так:
Проинтегрировав левую и правую части, и учитывая, что
получим
Эта формула называется формулой интегрирования по частям.
Пример 2. Требуется найти . Так как cos x = (sin x)?, мы можем записать, что
Из (5), полагая u = x и v = sin x, получаем
А поскольку (-cos x). = sin x мы находим, что и
Пример 3.
Следует подчеркнуть, что мы ограничились лишь весьма кратким введением в весьма обширный предмет, в котором накоплены многочисленные остроумные приемы.
Функции двух переменных. В связи с кривой y = f(x) мы рассмотрели две задачи.
1) Найти угловой коэффициент касательной к кривой в данной точке. Эта задача решается вычислением значения производной f ?(x) в указанной точке.
2) Найти площадь под кривой над отрезком оси х, ограниченную вертикальными линиями х = а и х = b. Эта задача решается вычислением определенного интеграла .
Каждая из этих задач имеет аналог в случае поверхности z = f(x,y).
1) Найти касательную плоскость к поверхности в данной точке.
2) Найти объем под поверхностью над частью плоскости ху, ограниченной кривой С, а сбоку - перпендикулярами к плоскости xy, проходящими через точки граничной кривой С (см. рис. 22).
Следующие примеры показывают, как решаются эти задачи.
Пример 4. Найти касательную плоскость к поверхности
в точке (0,0,2).
Плоскость определена, если заданы две лежащие в ней пересекающиеся прямые. Одну из таких прямых (l1) мы получим в плоскости xz (у = 0), вторую (l2) - в плоскости yz (x = 0) (см. рис. 23).
Прежде всего, если у = 0, то z = f(x,0) = 2 - 2x - 3x2. Производная по х, обозначаемая f?x(x,0) = -2 - 6x, при х = 0 имеет значение -2. Прямая l1, задаваемая уравнениями z = 2 - 2x, у = 0 - касательная к С1, линии пересечения поверхности с плоскостью у = 0. Аналогично, если х = 0, то f(0,y) = 2 - y - y2, и производная по у имеет вид
Так как f?y(0,0) = -1, кривая С2 - линия пересечения поверхности с плоскостью yz - имеет касательную l2, задаваемую уравнениями z = 2 - y, х = 0. Искомая касательная плоскость содержит обе прямые l1 и l2 и записывается уравнением
Это - уравнение плоскости. Кроме того, мы получаем прямые l1 и l2, полагая, соответственно, у = 0 и х = 0.
В том, что уравнение (7) действительно задает касательную плоскость, на эвристическом уровне можно убедиться, если заметить, что это уравнение содержит члены первого порядка, входящие в уравнение (6), и что члены второго порядка можно представить в виде -<2x2 + (x + y)2>. Так как это выражение отрицательно при всех значениях х и у, кроме х = у = 0, поверхность (6) всюду лежит ниже плоскости (7), кроме точки Р = (0,0,0). Можно сказать, что поверхность (6) выпукла вверх в точке Р.
Пример 5. Найти касательную плоскость к поверхности z = f(x,y) = x2 - y2 в начале координат 0.
На плоскости у = 0 имеем: z = f(x,0) = x2 и f?x(x,0) = 2x. На С1, линии пересечения, z = x2. В точке O угловой коэффициент равен f?x(0,0) = 0. На плоскости х = 0 имеем: z = f(0,y) = -y2 и f?y(0,y) = -2y. На С2, линии пересечения, z = -y2. В точке O угловой коэффициент кривой С2 равен f?y(0,0) = 0. Так как касательные к С1 и С2 являются осями х и у, касательная плоскость, содержащая их, есть плоскость z = 0.
Однако в окрестности начала координат наша поверхность не находится по одну сторону от касательной плоскости. Действительно, кривая С1 всюду, за исключением точки 0, лежит выше касательной плоскости, а кривая С2 - соответственно ниже ее. Поверхность пересекает касательную плоскость z = 0 по прямым у = х и у = -х. Про такую поверхность говорят, что она имеет седловую точку в начале координат (рис. 24).
Частные производные. В предыдущих примерах мы использовали производные от f (x,y) по х и по у. Рассмотрим теперь такие производные в более общем плане. Если у нас имеется функция двух переменных, например, F(x,y) = x2 - xy, то мы можем определить в каждой точке две ее "частные производные", одну - дифференцируя функцию по х и фиксируя у, другую - дифференцируя по у и фиксируя х. Первая из этих производных обозначается как f?x(x,y) или ?f/?x; вторая - как f?y(x,y) или ?f/?y. Если f(x,y) = x2 - xy, то ?f/?x = 2x - y и ?f/?y = -x. Заметим, что частные производные от любой функции - это, вообще говоря, новые функции. На практике эти функции в свою очередь дифференцируемы. Частные производные от f?x по х и у принято обозначать, соответственно, и или ?2f/?x2 и ?2f/?x?y; аналогичные обозначения используются и для частных производных от f?y. Если обе смешанные производные (по х и у, по у и х) непрерывны, то ?2f/?x?y = ?2f/?y?x; в нашем примере ?2f/?x?y = ?2f/?y?x = -1.
Частная производная f?x(x,y) указывает скорость изменения функции f в точке (x,y) в направлении возрастания х, а f?y(x,y) - скорость изменения функции f в направлении возрастания у. Скорость изменения функции f в точке (х,у) в направлении прямой, составляющей угол . с положительным направлением оси х, называется производной от функции f по направлению; ее величина представляет собой комбинацию двух частных производных от функции f - по х и по у, и равна
Как мы уже видели в частных случаях, касательная плоскость к поверхности z = f(x,y) в точке (x0, y0) имеет уравнение
Если обозначить x - x0 через dx, а y - y0 через dy, то уравнение касательной плоскости означает, что изменение dz = z - z0 в касательной плоскости, когда x изменяется на dx, а у - на dy, равно dz = f?x(x0,y0)dx + f?y(x0,y0)dy. Эта величина называется дифференциалом функции f. Если f имеет непрерывные частные производные, то изменение dz в касательной плоскости почти равно (при малых dx и dy) истинному изменению z на поверхности, но вычислить дифференциал обычно бывает легче.
Уже рассмотренная нами формула из метода замены переменной, известная как производная сложной функции или цепное правило, в одномерном случае, когда у зависит от х, а х зависит от t, имеет вид:
Для функций двух переменных аналогичная формула имеет вид:
Понятия и обозначения частного дифференцирования нетрудно обобщить на более высокие размерности. В частности, в случае если поверхность задана неявно уравнением f(x,y,z) = 0, уравнению касательной плоскости к поверхности можно придать более симметричную форму: уравнение касательной плоскости в точке (x0,y0,z0) имеет вид
Если задана поверхность f(x,y,z) = 0 и мы хотим узнать, что происходит на поверхности, то обычно любые две из трех переменных можно считать независимыми, а третью переменную рассматривать как зависимую от них. Иногда для обозначения частных производных в этом случае используется символ (?z/?x)y, чтобы подчеркнуть, что дифференцирование производится по х, а у считается независимой переменной. Имеем:
эта формула подчеркивает, что мы не можем придать независимый смысл символам ?x, ?y, ?z или рассматривать ?z/?x как отношение ?z к ?x.
Обратимся теперь к примеру второй задачи, т.е. вычислению объемов.
Пример 6. Найти объем тела, заключенного между поверхностью
и над единичным квадратом, см. на рис. 25.
Пусть V(x) - объем, ограниченный поверхностью и пятью плоскостями, а именно z = 0, y = 0, y = 1, x = 0 и плоскостью PQRS, перпендикулярной оси х и пересекающей эту ось на расстоянии х от начала координат.
Нетрудно видеть, что производная V ?(x) равна А(x), площади поперечного сечения PQRS. Таким образом,
Но А(x) - площадь под кривой
Следовательно,
где интегрирование проводится по у, а х рассматривается как постоянная. Подставляя (9) в (8), запишем V в виде повторного интеграла
В формуле (10) предполагается, что сначала проводится внутреннее интегрирование. Результат этого интегрирования, выражение <(5/6) - (x2/4)>, затем интегрируется по х от 0 до 1. Окончательный результат равен 3/4.
Формулу (10) можно интерпретировать и как так называемый двойной интеграл, т.е. как предел суммы объемов элементарных "клеток". Каждая такая клетка имеет основание ?x?y и высоту, равную высоте поверхности над некоторой точкой прямоугольного основания (см. рис. 26). Можно показать, что обе точки зрения на формулу (10) эквивалентны. Двойные интегралы используются для нахождения центров тяжести и многочисленных моментов, встречающихся в механике.
Более строгое обоснование математического аппарата. До сих пор мы излагали понятия и методы математического анализа на интуитивном уровне и, не колеблясь, прибегали к геометрическим фигурам. Нам осталось кратко рассмотреть более строгие методы, появившиеся в 19 и 20-м столетиях.
В начале 19 в., когда эпоха штурма и натиска в "создании математического анализа" завершилась, на первый план вышли вопросы его обоснования. В работах Абеля, Коши и ряда других выдающихся математиков были точно определены понятия "предела", "непрерывной функции", "сходящегося ряда". Это было необходимо для того, чтобы внести логический порядок в основание математического анализа с тем, чтобы сделать его надежным инструментом исследования. Потребность в тщательном обосновании стала еще более очевидной после открытия в 1872 Вейерштрассом всюду непрерывных, но нигде не дифференцируемых функций (график таких функций в каждой своей точке имеет излом). Этот результат произвел ошеломляющее впечатление на математиков, поскольку явно противоречил их геометрической интуиции. Еще более поразительным примером ненадежности геометрической интуиции стала построенная Д.Пеано непрерывная кривая, целиком заполняющая некоторый квадрат, т.е. проходящая через все его точки. Эти и другие открытия вызвали к жизни программу "арифметизации" математики, т.е. придания ей большей надежности путем обоснования всех математических понятий с помощью понятия числа. Почти пуританское воздержание от наглядности в работах по основаниям математики имело свое историческое оправдание.
По современным канонам логической строгости недопустимо говорить о площади под кривой y = f(x) и над отрезком оси х, даже если f - непрерывная функция, не определив предварительно точный смысл термина "площадь" и не установив, что определенная таким образом площадь действительно существует. Эта задача была успешно решена в 1854 Б.Риманом, который дал точное определение понятия определенного интеграла. С тех пор идея суммирования, стоящая за понятием определенного интеграла, была предметом многих глубоких исследований и обобщений. В результате сегодня удается придать смысл определенному интегралу, даже если подынтегральная функция является повсюду разрывной. Новые понятия интегрирования, в создание которых большой вклад внес А.Лебег (1875-1941) и другие математики, приумножили мощь и красоту современного математического анализа.
Вряд ли было бы уместно входить в детали всех этих и других понятий. Ограничимся лишь тем, что приведем строгие определения предела и определенного интеграла.
1) Число L называется пределом функции f (x) при х, стремящимся к а, если при любом сколь угодно малом числе . найдется соответствующее положительное число ?, такое, что
(Вертикальные черточки означают, что мы имеем дело с абсолютной величиной заключенного между ними числа.)
Если эта сумма имеет предел L, когда n стремится к бесконечности и наибольшая длина ?kx стремится к нулю, причем L не зависит от выбора xk* и xk, то L называется определенным интегралом от f(x) по
в смысле Римана и обозначается
В заключение скажем, что
математический анализ, являясь крайне ценным инструментом в руках ученого и инженера, и сегодня привлекает внимание математиков как источник плодотворных идей. В то же время современное развитие как будто свидетельствует и о том, что
математический анализ все более поглощается такими доминирующими в 20 в. разделами математики, как абстрактная алгебра и топология. См. также
ФУНКЦИЙ ТЕОРИЯ;
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ.